草庐IT

python - Mongoengine 文档作为 EmbeddedDocument

全部标签

python - 关于正则表达式和 XML

我有XML格式的数据。示例如下所示。我想从tag中提取数据.这是我的XML数据。The40-Year-OldVirginisa2005Americanbuddycomedyfilmaboutamiddle-agedman'sjourneytofinallyhavesex.TheplotAndyStitzer(SteveCarell)istheeponymous40-year-oldvirgin.CastSoundtrackExternalLinks我只需要The40-Year-OldVirginisa2005Americanbuddycomedyfilmaboutamiddle-age

php - 通过 php domdocument 解析器获取文档元素的子元素

好吧,这是一个非常常见的xml解析方法,获取子节点,但它对我来说不起作用......我无法从我的根元素中获取子节点数组,但当它们有子节点时我可以从任何其他节点获取它,这不是问题。每当我从这个文档元素中获取子节点时,我似乎只能获取第一个子节点。我需要从文档元素中获取所有第一级节点..$xdoc=createDOMDocument($file);$all_children=$xdoc->documentElement->childNodes;echocount($all_children);functioncreateDOMDocument($file){$xdoc=newDOMDocum

python - 使用 XPATH 处理格式错误的 HTML 文件

我继承了别人的(糟糕的)代码库,目前正拼命地尝试修复问题。今天,这意味着收集我们模板/主页中所有无效链接的列表。我目前在Python中使用ElementTree,尝试使用xpath解析站点。不幸的是,似乎html格式不正确,ElementTree不断抛出错误。是否有更多错误友好的xpath解析器?有没有办法在非严格模式下运行ElementTree?是否有任何其他方法,例如预处理,可以用来帮助这个过程? 最佳答案 LXML可以解析一些格式错误的HTML,实现ElementTreeAPI的扩展版本,并支持XPath:>>>fromlxm

html - 将 'embedded' XML 文档转换为 XSLT (1.0) 中的 CDATA 输出

给定一个像这样的输入XML文档:Thiscontainsan'embedded'HTMLdocumentHTMLDOCHelloWorld我如何提取“内部”HTML文档;将其呈现为CDATA并包含在我的输出文档中?因此输出文档将是一个HTML文档;其中包含一个将元素显示为文本的文本框(因此它将显示内部文档的“源View”)。我试过这个:但这只会渲染文本节点。我试过这个:]]>但这逃避了实际的XSLT,我得到:<xsl:value-ofselect="*"/>我试过这个:[...]这确实插入了一个CDATA部分,但输出仍然只包含文本(剥离的元素):MydocTitle:Thi

xml - 在 XSLT 中用逗号作为小数点分隔符求和数字?

我有一个XML文件,其中数字以逗号分隔我想对XSLT中的/foo/bar/@val值求和,但我有点卡在格式上。有谁知道正确的语法是什么? 最佳答案 我猜测,“val”属性中指定的值是一个用逗号代替小数点的数字。有几种可能的解决方案:我。XSLT1.0这个转换:应用于最初提供的XML文档时:产生想要的结果:13.68二。XSLT2.0这个转换:应用于同一个XML文档时,产生相同的正确结果:13.68III.FXSL2.x这个转换:应用于同一XML文档时产生相同的正确结果:13.68最后一种解决方案更灵活,当需要在求和之前对值进行更复杂

python - 将 python 对象转换为 XML 表示

在我的数据库中,我有一些需要在xml文件中表示的对象。将项目对象转换为项目的xml表示的最简单/最简单的方法是什么?我应该使用什么Python库? 最佳答案 拥有那个确切的结构有多重要?Django包含一个serializationframework可以将查询集转换为XML,但它根本不符合您的格式。否则您将需要手动编写-为此,我发现最简单的方法是编写一个模型方法,该方法可以以所需格式输出单个实例,然后在循环中对查询集的每个成员调用它。 关于python-将python对象转换为XML表示

Python lxml 更改标签层次结构?

我在使用lxml时遇到了一个小问题。我正在将XML文档转换为HTML文档。原始XML看起来像这样(它看起来像HTML,但它在XML文档中):Localization-Eiffeltower?ParisorVegasBayestheoremp(A|B)当我这样做时(项目是上面的字符串)lxml.html.tostring(lxml.html.fromstring(item))我明白了:Localization-Eiffeltower?ParisorVegasBayestheoremp(A|B)我对没有任何问题,但“贝叶斯定理”段落不再嵌套在外部段落中这一事实是一个问题。有人知道为什么lx

sql-server - XML作为存储过程中的参数(sql server)

我有一个带有XML参数的存储过程。我的问题是关于XML的格式。此解决方案有效:2013-01-012013-01-02SELECT*FROMOPENXML(@handle,'/ROOT/id')WITH(idDateDate)结果:2013-01-01..2013-01-02但是第二种方案不行,为什么?2013-01-012013-01-02SELECT*FROMOPENXML(@handle,'/ROOT')WITH(idDateDate)结果:NullXML格式正确,不是吗? 最佳答案 您声称有效的第一个查询实际上不适用于您提供

Python:使用 minidom 搜索具有特定文本的节点

我目前面临的XML看起来像这样:345754这包含在层次结构中。我已经解析了xml,并希望通过搜索“345754”找到ID节点。 最佳答案 vartec的回答需要更正(抱歉,我不确定我能不能做到),它应该是:xmldoc=xml.dom.minidom.parse('your.xml')matchingNodes=[nodefornodeinxmldoc.getElementsByTagName("ID")ifnode.firstChild.nodeValue=='345754']它有两处错误:(i)标签名称区分大小写,因此匹配"i

Python 的 libxml2 无法解析 unicode 字符串

好的,Python的libxml2绑定(bind)的文档确实是****。我的问题:XML文档存储在Python中的字符串变量中。该字符串是Unicode的实例,其中包含非ASCII字符。我想用libxml2解析它,看起来像这样:#-*-coding:utf-8-*-importlibxml2DOC=u"""Bäääh!"""xml_doc=libxml2.parseDoc(DOC)结果是:Traceback(mostrecentcalllast):File"test.py",line13,inxml_doc=libxml2.parseDoc(DOC)File"c:\Python26\l